从零构建大模型



从零构建大模型
作者:[美]塞巴斯蒂安·拉施卡
译者:覃立波
分类:计算机类
出版社:人民邮电出版社
出版时间:2025.4
ISBN:310

内容简介:

本书是关于如何从零开始构建大模型大模型的指南,由畅销书作家塞巴斯蒂安 • 拉施卡撰写,通过清 晰的文字、图表和实例,逐步指导读者创建自己的大模型。 在本书中,读者将学习如何规划和编写大模型 的各个组成部分、为大模型训练准备适当的数据集、进行通用语料库的预训练,以及定制特定任务的微调。 此外,本书还将探讨如何利用人工反馈确保大模型遵循指令,以及如何将预训练权重加载到大模型中。 

本书适合对机器学习和生成式 AI 感兴趣的读者阅读,特别是那些希望从零开始构建自己的大模型的 读者。

塞巴斯蒂安·拉施卡(Sebastian Raschka)

极具影响力的人工智能专家,GitHub项目LLMs-from-scratch的星标数达4万。

现在大模型独角兽公司Lightning AI任资深研究工程师。博士毕业于密歇根州立大学,2018~2023年威斯康星大学麦迪逊分校助理教授(终身教职),从事深度学习科研和教学。

除本书外,他还写作了畅销书《大模型技术30讲》和《Python机器学习》。


覃立波

中南大学特聘教授,博士生导师。现任中国中文信息学会青工委秘书长。主要研究兴趣为人工智能、自然语言处理、大模型等。曾担任ACL.EMNLP、NAACL. IJCAI等国际会议领域主席或高级程序委员会委员。

冯骁骋

哈尔滨工业大学计算学部社会计算与交互机器人研究中心教授,博士生导师,人工智能学院副院长。研究兴趣包括自然语言处理、大模型等。在AcL、AAAl、lJCAl、TKDE、TOIS 等CCFA旧类国际会议及期刊发表论文50余篇。

刘乾

新加坡某公司的研究科学家,主要研究方向是代码生成与自然语言推理。他在顶级人工智能会议〔如ICLR、NeurlPS、ICML )上发表了数十篇论文,曾获得2020年百度奖学金提名奖、北京市2023年优秀博士论文提名奖、2024年 KAUSTRising Stars inAl等荣誉。


继续点击获取即表示您已阅读并同意《本站声明